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The invention relates 
a method for reading document 
entries and addresses. Automatic 
reading comprises intermediate 
steps: layout analysis, classifying 
the segmented axeas and 
inteipreting the results in a 
reader as well as video coding 
if required. According to the 
invention, image data and the 
allocated reading results and 
intermediate results arc stored for 
a relevant random sample during 
reading in the case of clearly and 
automatically read information 
and/or image data and the reading 
results and intermediate results 
which are clearly determined by 
using video coding results in a 
second automatic reading process 
are stored for a relevant random 
sample when video coding is 
also used to clearly deteimine 
informadon. The automatic reader 
is newly adapted by said relevant random sample. 
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(57) Zusammenfassung 

Bedarf eine Videocodierung. ^un^7^"^nZST^T S!If^ ""d Intopretation der Ergebnisse in einem Leser und be, 
Bilddatcn und die zugeordnften uSSLS^Sh^!:^^ 5*' f^?""'^ «"°inatlsch gelesenen Infonnationen die 
die Bilddaten und die eindeX dnem zweST^Sti^^h^^^ 

Les«^ und Zwischenergebnisse ^^aJ^Ts^^^^^^TT^ E nbeziehung der Videocoding-Eigebnisse ermittelten 
adaptiert Sttchpiobe gespeicheit Mit dieser aktueUen StichpiDbe wild der automatische Leser neu 
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Beschreibung 

Verfahren zum Lesen von Dokumenteintragungen und Adressen 

5 Die Erfindung betrifft ein Verfahren zum Lesen von Dokumentein- 
tragungen und Adressen nach dem Oberbegriff des Anspruches 1. 

Lesesysteme haben die Aufgabe, in einem speziellen Anwen- 
dungskontext Textbestandteile, die auch Zahlen enthalten kon- 

10 nen, auf einem Dokument oder einer Sendung in den elektroni- 
schen Squivalenten Text zu wandeln und die in dieser Anwen- 
dung wichtigen spezifischen Inf ormationen abzuleiten. Bei- 
spiele fur Lesesysteme sind Adrefileser, deren Aufgabe es ist, 
aus den auf postalischen Sendungen, wie Briefen oder Paketen, 

15 befindlichen Textbestandteilen, speziell aus dem Bereich der 
Empf angeradresse, die Schrif tzeichen und Zahlen zu erkennen 
und aus deren Menge den Verteilcode abzuleiten . 

Dazu werden eine Reihe von Erkennungsverf ahren eingesetzt, 
20 die nach der Abtastung des Dokuments oder der Sendung das 

daraus resultierende elektronische Bild Schritt fur Schritt 
in elektronischen Text wandeln- Die T^ilschritte sind im ein- 
zelnen Layoutanalyse ( Dokument typerkennung, Bestiininung der 
interessierenden Gebiete/Region of Interest (ROI), Segmentie- 
25 rung des Textbildes in Zeilen, Worter und/oder Zeichen, 

Schriftzeichenklassif ikation oder Erkennung gebundener Hand- 
schrift, und abschlieBende Interpretation der Textbestandtei- 
le. Jeder Erkennungsschritt besitzt einen definierten Parame- 
tersatz, der die Losung der Teilerkennungsauf gabe bestimmt. 

30 

Die Erkennungsschritte eines Lesesystems und damit . das Lese- 
system selbst werden zur Losung einer vorgegebenen Leseaufga- 
be auf deren speziellen Eigenschaf ten adaptiert, um ein m5g- 
lichst gutes Leseergebnis zu erzielen. Dazu werden Beispiel- 
35 dpkumente und -sendungen zusammengestellt (Stichproben) , die 
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die Anforderungen der Leseaufgabe moglichst gut beschreiben. 
Zu jedem Dokument wird die korrekte Losung (Label) in Form 
des zu extrahierenden Textes gestellt, so dali eine Datenbasi 
von Paaren von Dokumentbildern and dem Sollergebnis (Label) 
aufgebaut wird. Zu diesem Sollergebnis gehoren auch die Er- 
gebnisse der Leseteilschritte. 

Die Parameter- der einzelnen Erkennungsschritte werden nach 
dem Stand der Technik vor dem eigentllchen Lesebetrieb so 
eingestellt, dali die Leseaufgabe, reprasentiert durch die ge- 
labelte Stichprobe, mOglichst gut gelost wird. Dieser als Ad- 
aption bezeichnete Prozeli ist iterativ. 

Folgende 3 Schritte werden zyklisch so lange durchlaufen, bis 
die Erkennungsleistung ausreichend ist: 

wahlen einer Parametereinstellung, Test des Lesesystems an- 
hand der Stichprobenbilder, Evaluierung der Ergebnisse anhand 
der gegebenen Sollergebnisse bzw. Label. 

Nach der Adaption ist das Lesesystem fur die Bearbeitung der 
Elements der Stichprobe optimiert. Die Zusammenset zung der 
Stichprobe bestimmt folglich zu einem hohen Grad die Erken- 
nungsleistung des Lesesystems, insbesondere da die ermittelte 
Parameterkonfiguration der Erkennungsschritte wahrend des Be- 
triebs fiir jedes ausgelief erte Lesesystem beibehalten wird. 
Da die tatsachliche Verteilung der zu lesenden Dokumente far 
einen speziellen Einsatzort (site) nicht vorhergesehen werden 
kann, ist das Lesesystem nicht optimal an die ortsspezif ische 
Leseaufgabe adaptiert. Insbesondere konnen ortliche Besonder- 
heiten und zeitliche Anderungen der Lesegutverteilung nicht 
vom Lesesystem beriicksichtigt werden. 

2ur Zeit im Einsatz befindliche Lesesysteme besitzen nicht 
die Eigenschaft, sich anhand der tatsachlich bearbeiteten Do- 
kumente wahrend des Betriebs dynamisch an die vorhandenen Ei- 



wo 00/48119 PCT/DEOO/00269 

3 

genschaften zu adaptieren. Stets werden im Vorfeld/ wie be- 
schrieben, die einzelnen Erkennungsschritte einmal an vorge- 
gebenen statischen Stichproben adaptiert, und die daraus ab- 
geleiteten Parametersatze in der Anwendung konstant gehalten. 
Dazu gibt es eine Vielzahl von Verfahren zur Schrif tzeichen- 
erkennung, die mittels einer vorgegebenen gelabelten Lern- 
stichprobe an die zu losende Aufgabe adaptiert werden. 
[Schiirmann, Jurgen: Pattern Classification, Wiley Inter- 
science, 1996] . Fur Verfahren zur Erkennung gebundener Hand- 
schrift sind ebenfalls Adaptionsalgorithmen bekannt. [Rabiner, 
Lawrence R. : A Tutorial on Hidden Markov ^!Iodels and Selected 
Applications in Speech Recognition Proceedings of the IEEE, 
Vol. 77, No. 2, February 1989], ebenso wie zur Klassif ikation 
von Formulartypen. Neben diesen Optimierungsansatzen, die ein 
Klassif ikationsproblem losen, sind Verfahren bekannt, die die 
Parameter durch „gezieltes Ausprobieren^^ optimieren, wie Evo- 
lutionare Algorithmen, Simulated Annealing, o.a. [Ruinelhart , 
D.E. et al.: Learning Internal Representation by Error Propa- 
gation, Parallel Distributed Processing, Vol.1, MIT Press, 
Cambridge,. MA, 1986/Press, Will H. et al.: Numerical Reciped 
in C, Chapter 10, Minimization or Maximization of Functions, 
Cambridge University Press, 1992] . Anwendungen dazu sind To- 
pologieoptimierung neuronaler Netze, die beispielsweise zur 
Schrif tzeichenklassif ikation verwendet werden. Beim Einsatz 
dieser Verfahren wird jedoch stets eine vorab definierte 
Stichprobe verwendet, aus der die optimierten Parametersatze 
berechnet werden, die in der Anwendung nicht mehr verandert 
werden. 

Der im Anspruch 1 angegebenen Erfindurig liegt die Aufgabe zu- 
grunde, ein Verfahren zum Lesen von Dokumenteintragungen und 
Adressen zu schaffen, das eine automatische Adaption des au- 
tomatischen Lesers an aktuelle Bedingungen und Zusammen- 
setzungen des Lesegutes gestattet. 
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Der Erfindung liegt der Gedanke zugrunde, den automat ischen 
Leser nicht nur wie bisher in einer vorgelagerten Phase an- 
hand einer ausgewShlten Stichprobe zu adaptieren, sondern 
wahrend des laufenden Lesebetriebes eine neue Stichprobe zu 
generieren bzw. die urspriingliche Stichprobe zu aktualisieren 
und die Parameter des Lesers automatisch mit dieser Stichpro- 
be neu einzustellen. Dadurch erfolgt eine standige und auto- 
matische Anpassung des Lesers an unterschiedliche ortliche 
Eigenschaften des Lesegutes bzw. eine sich andernde Gutzusam- 
mensetzung. Zur Generierung aktueller Stichprobenbestandteile 
werden bei eindeutig automatisch gelesenen Inf ormationen von 
Bildern ausgewahlten Lesegutes die den Bilddaten zugeordneten 
Lese- und Zwischenergebnisse gespeichert. Wurde die gewunsch- 
te Information mithilfe der Videocodierung ermittelt, weil 
mit dem automatischen Leser kein eindeutiges Ergebnis erzielt 
wurde, so wird das Bild unter Einbeziehung des Ergebnisses 
der Videocodierung in einer zweiten Lesephase noch einmal au- 
tomatisch gelesen. Kann dieses zweite Lesen mit einem eindeu- 
tigen Leseergebnis abgeschlossen werden, so werden die nun 
erzielten Lese- und Zwischenergebnisse den zugehorigen Bild- 
daten zugeordnet und ebenfalls fur die aktuelle Stichprobe 
gespeichert . 

1st der zweite Lesevorgang nicht erfolgreich, so wird dieses 
Abbild der zu lesenden Gutoberf lache mit den Ergebnissen 
nicht in die Stichprobe aufgenommen. Mit der aktuellen Stich- 
probe wird der automatische Leser dann neu adaptiert. 

Vorteilhafte Ausgestaltungen der Erfindung sind in den Un- 
teranspriichen dargestellt. 

So ist es vorteilhaft, den zweiten Lesevorgang ohne Zeitbe- 
schrankungen durchzuf uhren. Dadurch k5nnen Abbildungen er- 
folgreich gelesen und in die Stichprobe aufgenommen werden, 
die beim ersten Leser nur wegen des Oberschreitens des Zeit- 



wo 00/48119 



PCT/DEOO/00269 



limits zuriickgewiesen warden. Abbilder, die aufgrund von In- 
konsistenzen, z.B. infolge Fehleingaben beim Videocodieren 
Oder infolge von Falschadressierungen, zu Fehladaptionen fiih 
ren konnten, werden vorteilhaft nicht in die Stichprobe iiber 
nomine n . 



10 
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Um den Adaptionsauf wand zu reduzieren, ist es gunstig, fur 
jedes mithilfe des Videocodierens erfolgreich gelesene Bild 
die Zwischenergebnisse beim ersten automatischen Lesen mit 
den Zwischenergebnissen beim zweiten automatischen Lesen zu 
vergleichen und signifikante Abweichungen als Auswertef ehler 
in den Zwischenschritten beim ersten automatischen Lesen sta- 
tistisch zu erfassen. Es werden dann nur die Zwischenschritte 
neu adaptiert, deren Fehlerhauf igkeit wahrend einer bestimm- 
ten Zeitspanne iiber einem festgelegten Wert liegt. 



20 



Weiterhin ist es vorteilhaft, die Leserate beim ersten auto- 
matischen Lesen zu uberwachen. Nur wenn diese uber einen 
festgelegten Zeitraum unterhalb eines Schwellwertes liegt, 
werden der Leser oder die Zwischenschritte mit der aktuellen 
Stichprobe neu adaptiert. 
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In einer weiteren vorteilhaf ten Ausgestaltung wird uber eine 
Stichprobe die Leserate an einem automatischen Leser gleicher 
Funktionalitat mit den vorherigen und den neu adaptierten Pa- 
rametern ermittelt. Nur bei einer Verbesserung durch die neu 
adaptierten Parameter wird der automatische Leser neu initia- 
lisiert. Damit wird sichergestellt , dali Neuinitialisierungen 
nur im notwendigen Malie bei. Verbesserungen durchgefuhrt wer- 
den. 



35 



Ob jedes neu gelesene Bild mit eindeutig gelesener Informa- 
tion Oder nur jedes x-te Bild in die Stichprobe aufgenommen 
wird, hangt davon ab, wie hoch der Anfall der zu lesenden Cu- 
ter ist, wieviel Bilder die Stichprobe umfassen soli und wie 
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grofi die die Leseergebnisse beeinf lussenden Veranderungen in 
den Bildern sind. 



Gunstig ist es auch, wenn die Stichprobe aus nur automatisch 
gelesenen und videocodierten Bildern im festgelegten VerhMlt- 
nis zusammengesetzt ist. Damit ist sichergestellt , daft die 
die Neuadaption besonders beeinf lussenden kritischen Falle 
mit Videocodierung ausreichend berucksichtigt werden. Die 
Neuadaption kann sowohl mit aktualisierten Stichproben, bei 
denen die alten Elemente durch neue ersetzt werden als auch 
mit neuen Stichproben durchgefiihrt werden. Die Auswahl hangt 
von den konkreten Bedingungen, wie z.B. Gutanfall in der 
Zeiteinheit, Veranderungsgeschwindigkeit der Leserate, ab. 

Anschlieliend wird die Erfindung in einem Ausf uhrungsbeispiel 
2um AdreJilesen anhand der Zeichnung naher erlautert. Dabei 
zeigen 

FIG 1 eine Blockstruktur des Lesers mit Schnittstel- 

len 2um Adaptionsprozefi , Monitorprozeft und 
Stichprobengenerator 
FIG 2 eine Ablauf struktur des Monitorprozesses 

FIG 3 eine Ablauf struktur des Stichprobengenerators 

FIG 4 eine Ablauf struktur des Adaptionsprozesses 

Beiiti Adrefilesen hat der Leser 4 0 gemafi FIG 1 die Aufgabe, auf 
einem Sendungsbild 1 die Anschrift zu finden, die Schriftzei- 
Chen der Adresse zu decodieren und die fiir die Sortierung re- 
levanten Inf ormationen aus ihr zu extrahieren. Wenn der Le- 
ser 4 0 die Verteilinformation nicht automatisch ermitteln 
kann (Riickweisung) , wird das Bild 1 der Sendung an einen Vi- 
deocodierplatz 6 gesendet, an dem ein Bearbeiter diese Daten 
manuell eingibt, beispielsweise die Postleitzahl . 

Die fur die Verteilauf gabe relevanten Inf ormationen umfassen 
in der Regel die Postleitzahl, den Ort, die StraJie mit Haus- 
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nummer und teilweise den Namen und Vornamen des Adressaten. 
Welche Telle der Anschrift fur die Sortlerung relevant sind, 
wird von der konkreten Anwendung definiert. 

Der Leser 40 gliedert sich in die Teilverf ahren Layoutanaly- 
se 2 (Dokumenttyperkennung, ROI-Lokalisierung, Segmentie- 
rung) , Erkennung von Einzelzeiehen und gebundener Hand- 
schrif t 3 und die Adreliinterpretation 4 . Zur Losung einer Le- 
seaufgabe werden diese Teilverf ahren sequentiell abgearbei- 
tet . 

• * 

Jedes Teilverf ahren besitzt einen anwendungsspezif ischen Pa- 
rametersatz 5, der aus einer Adaption mit einer vorgegebenen 
Stichprobe ermittelt worden ist, die in der Regel mehrere 
tausend Sendungen umfafit. Das Lesesystem wird nach dieser Ad- 
aption landesweit in den postalischen Verteilzentren einge- 
setzt. Die dort taglich angetrof f enen Sendungen k^nnen sich 
erheblich von den Sendungen unterscheiden, mit denen das Sy- 
stem optimiert worden ist; zudem konnen sich Sendungseigen- 
schaften mit der Zeit signifikant so andern, daB das Lesesy- 
stem nur noch suboptimal arbeitet. 

Das beschriebene Verf ahren optimiert den Leser 4 0 standig und 
automatisch an die rSumlichen Besonderheiten der Adrelilese- 
aufgabe und an mogliche zeitliche Veranderungen; damit werden 
die Schwachen bisheriger ,,statischer'' AdreBleser kompensiert. 
Ausgangspunkt ist der Leser Lq, charakterisiert durch die 
Ausgangsparameter Po zum Zeitpunkt T = to- Mit f ortschreiten- 
der Zeit werden bei Bedarf die Parametersatze neu adaptiert, 
und es entstehen Inkarnationen von neuen Lesern. Die Lesera- 
ten eines neu adaptierten Lesesystems Li und des Vorgangersy- 
stems Li-i werden anhand einer Verif ikationsstichprobe ermit- 
telt. Nur bei Verbesserung wird Li verwendet, ansonsten der 
bisherige Leser. 
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Das Verfahren beinhaltet den an sich bekannten Leser 40 
(FIG 1), einen Monitorprozefi 11 (FIG 2), einen Stichprobenge 
nerator 10 (FIG 3) und einen Adapt ionsprozeJb 9 (FIG 4) . 

Der Leser 40 realisiert wie im Stand der Technik bereits be- 
schrieben, die Verf ahrensschritte Layoutanalyse 2, Klassifi- 
kation 3 und Adreiiinterpretation 4. Die Eingabe in den Le- 
ser. 4 0 besteht aus dem Bild 1 einer Sendung 1, das uber die 
Verfahrensschritte mit dem Ziel analysiert wird, aus den fiir 
die Verteilung relevanten Inf ormationen den Verteilcode 8 ab- 
zuleiten. Hierzu wird das Sendungsbild 1 bei der Layoutanaly- 
se 2 in informationstragende und unrelevante Bereiche zer- 
legt. Die inf ormationstragenden Bereiche werden waiter in 
ihre kleinsten inf ormationstragenden Einheiten zerlegt. Diese 
sind bei Blockschrift die einzelnen Zeichen und bei gebunde- 
ner Schrift Worter. Diese Einheiten werden mit entsprechenden 
Klassifikatoren klassif iziert 3 und die Klassif ikationsergeb- 
nisse den Bereichen zugeordnet. Alle Bereiche mit ihren iden- 
tifizierenden Merkmalen (Geometrie, Lage, Orientierung, Klas- 
sif ikationsergebnisse) werden in einem auBerhalb des Moduls 
gelegenen Speicher abgelegt. Aus diesen Zwischenergebnissen 7 
ermittelt die Adreiiinterpretation 4 den wahrscheinlichsten 
Eintrag aus dem Worterbuch, das alle giiltigen Adressen ent- 
halt und zum Parametersatz der Adreiiinterpretation 4 gehort. 
Fur den gefundenen Worterbucheintrag wird aus einer Tabelle 
der Verteilcode ausgelesen und beispielsweise an eine Maschi- 
nensteuerung einer Sortiermaschine weitergegeben, die dann 
dafiir sorgt, dali die Sendung im richtigen Sortierfach landet. 
Kann kein wahrscheinlicher WSrterbucheintrag gefunden werden, 
geht das Sendungsbild 1 an die Videocodierung 6, wo ein 
Mensch die verteilrelevanten Inf ormationen in das System ein- 
gibt. Die Maschinensteuerung liegt auflerhalb des Leser s 4 0 
und ist auf den Figuren nicht enthalten. 
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Der Monitorprozefi 11 hat die Aufgabe, eine Leserate Ober die 
Zeit zu ermitteln 13 und bekommt hierzu vom Leser 40 mit ei- 
nem Flag 12 mitgeteilt, ob die bearbeitete Sendung automa- " 
tisch gelesen werden konnte oder nicht. Er iiberwacht die Le- 
serate standig 14, stoJit bei einem signif ikanten Absinken der 
Leserate einen Adaptionsprozefi 9 an und wartet auf seine Be- 
endigung. Bei der Beendigung des Adaptionsprozesses 9 teilt 
dieser dem MonitorprozeJi mit, ob die Adaption erfolgreich war 
Oder nicht 15. Eine Adaption ist dann erfolgreich, wenn durch 
sie eine Verbesserung des Lesers 40 erreicht wird. Bei einer 
erfolgreichen Adaption wird die Statistik zurtickgesetzt 16, 
d.h. mit der Berechnung der Leserate wird neu begonnen. Als 
Startwert wird die Leserate verwendet, die das adaptierte Sy- 
stem auf der Teststichprobe erreicht hat. Nach einer erfolg- 
losen Adaption oder nach dem Zuriicksetzen der Statistik wird 
die Beobachtung der Leserate fortgesetzt. 

Der Stichprobengenerator 10 ist in der FIG 3 dargestellt und 
bildet eines der neuen Kernmodule. Er hat die Aufgabe, aus 
den Leseergebnissen des Lesers 40, dem Sendungsbild 1 und 
ggf . der Videocodiereingabe 6 Stichproben zu generieren, die 
sich 2ur Adaption des Lesers 40 eignen. Um diese Aufgabe 
wahrnehmen zu konnen, hat der Stichprobengenerator 10 die ' 
Moglichkeit, das Sendungsbild 1, die Zwischenergebnisse 7, 
das Flag 12, ob die Sendung videocodiert wurde oder nicht und 
den Verteilcode 8 aus dem Leser 4 0 auszulesen. 

Als erster Schritt wird iiberpruft, ob die aktuell zu bearbei- 
tende Sendung videocodiert wurde oder nicht 6. Bei videoco- 
dierten Sendungen sind die Zwischenergebnisse unvollstandig 
oderfalsch. Da aber aus ihnen die Stichprobe generiert wird 
und man gerade aus Fehlern am meisten lernen kann, haben die- 
se Sendungsbilder einen besonders hohen Stellenwert. Deshalb 
lohnt es sich, die vollstandigen Zwischenergebnisse auch mit 
einem relativ hohen Auf wand zu erzeugen. Je mehr Zwischener- 
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gebnisse von videocodierten Sendungen erzeugt werden konnen, 
desto groBere Verbesserungen kann man von einer Adaption er- 
warten. Die Berechnung der Zwischenergebnisse von videoco- 
dierten Sendungen erfolgt durch einen weiteren Leser 17 glei- 
cher Funktiorialitat. Der Unterschied liegt vor allem in einem 
durch den Verteilcode aus der Videocodierung eingeschranktem 
Worterbuch. Optional kann dieser Leser 17 auch so eingestellt 
werden, dafi er den gesamten Suchraum nach der richtigen L5- 
sung durchsucht, indem die Beschrankungen, vor allem fiir die 
Laufzeit pro Sendung, aufgehoben wird. Dadurch wird der Leser 
17 in die Lage versetzt, viele Sendungen automatisch zu le- 
sen, die er zuvor nicht lesen konnte. 

Kann eine Sendung trotz Videocodierung beim zweiten Mai nicht 
automatisch gelesen werden 18, wird sie fur die aktuelle 
Stichprobe verworfen oder in einer Problemstichprobe gesam- 
melt und der Stichprobengenerator 10 holt sich die nachste 
Sendung. Optional kann aber ein weitergehender Videocodier- 
dialog eingebunden werden, bei dem jeder Zwischenschritt von 
einem Menschen videocodiert werden kann. Dann konnen die Zwi- 
schenergebnisse von noch mehr Sendungen erzeugt werden und 
somit eine noch groliere Verbesserung bei der Adaption erwar- 
tet werden. Aus KostengrUnden ist aber ein solcher Videoco- 
dierdialog nicht immer sinnvoll. 

Die erzeugten Zwischenergebnisse 19 konnen nun mit den Zwi- 
schenergebnissen 7 aus dem Lesesystem verglichen werden. 
Hierbei werden die Ergebnisse der Zwischenschritte in der 
Verfahrensreihenfolge miteinander verglichen (20) . Bei der 
ersten signif ikanten Abweichung zwischen den Ergebnissen, 
kann daraus geschlossen werden, daB das korrespondierende Sy- 
stemmodul einen Fehler gemacht hat. Weiterhin kann aus diesem 
Vergleich beobachtet werden, welche frtihen Fehler sich wie 
stark auf nachfolgende Systemmodule auswirken. Diese Stati- 
stik 21 gibt wichtige Hinweise auf Sys'temschwachpunkte . 
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Unabhangig davon^ ob die vollstandigen Zwischenergebnisse vom 
zweiten Leser 17 erzeugt wurden oder vom Laser 4 0 stammen, 
gehen sie in einen ValidierungsprozeB 22, bevor sie in die 
Stichprobe 23 auf genonimen warden. Dieser Prozefi hat die Auf- 
gabe, aus den Zwischenergabnissen jene Alternativen als 
Sollergebnis auszuwahlen, die dem Sendungsauf druck entspre- 
chen. Dieser Schritt ist notig, weil die Adreliinterpretation 
fehlertolerant arbeitet und z.B. Tippfehler in der Anschrift, 
fehlerhafte Klassif ikationsergebnisse auf einzelnen Zeichen, 
usw. ausgleicht und trotzdem die richtige Adresse findet. 
Tragt z.B, ein Brief die Anschrift ,,78467 Komstanz"\ so kann 
man aufgrund der Postleitzahl und der Nahe von m zu n sowie 
der Obereinstimmung der anderen Buchstaben mit Konstanz 
schlieBen, daft es sich urn einen Brief nach Konstanz handelt. 
So darf das m aus Komstanz fur die Einzelzeichenklassif ikati- 
on auf keinen Fall das Sollergebnis n zugeordnet bekommen, 
obwohl die Sollkennung fur die Adreliinterpretation Konstanz 
ist. Da das automatische Validierungsverf ahren auf jede 
menschliche Mithilfe verzichten muli, gibt es keine absolute 
Sicherheit uber die tatsachlich richtigen Zeichen auf dem 
Brief. Um falsche Sollergebnisse zu vermeiden, wird das Sol- 
lergebnis der AdreBinterpretation ubernommen, mit der Ausnah- 
me von solchen Stellan, an danen die vorgeschalteten Zwi- 
schenschritte stark von dem Sollergebnis abwaichen. Dort wer- 
den drei Falle unterschieden: 

1. Im ersten Fall empfiehlt der vorgeschaltete Zwischen- 
schritt mit hoher Sicherheit ein anderes Ergebnis. In dia- 
sem Fall wird das Ergebnis das Zwischenschritts als Sol- 
lergebnis fur diesen Zwischenschritt ubarnomman. 

2. Im zweiten Fall liefert der vorgeschaltete Zwischenschritt 
eine Liste von Alternativen und das Sollergebnis der 
Adrefiinterpretation ist. in dieser Liste enthalten. Dann 
wird das Sollergebnis der Adreliinterpretation als Soller- 
gebnis fur diesen Zwischenschritt ubernommen. 
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3. Der dritte Fall entspricht dem zweiten, mit der Ausnahme, 
daB das Sollergebnis der AdreBinterpretation nicht in der 
Alternativenliste enthalten ist. In diesem Fall wird kein 
Sollergebnis fiir diesen Zwischenschritt generiert, um ein 
falsches Sollergebnis zu vermeiden. 

Die so validierten Bilder und Zwischenergebnisse 22 warden in 
der Stichprobe 23 abgelegt. Die Stichprobe enthalt den Bild- 
daten zugeordnete Lese- und Zwischenergebnisse und kann auf 
verschiedene Art organisiert sein: 

1. Die Stichprobe beinhaltet eine Ansainmlung von Zwischener- 
gebnissen. 

2. Die Stichprobe beinhaltet jeweils eine Datei fur die Zwi- 
schenschritte, d.h. die Zwischenergebnisse fur den Leser 
40 werden in die Zwischenergebnisse der einzelnen Zwi- 
schenschritte zerlegt. 

3. Unabhangig von 1. und 2 . wird die Stichprobe in die zwei 

Falle „automatisch gelesen" und „videocodiert" auf gespal- 
tet . 

4. Unabhangig von 1. bis 3., ist die mogliche GroBe der 
Stichprobe begrenzt. Deswegen werden, wenn die maximale 
GroBe erreicht ist, die aitesten Stichprobenelemente von 
neuen iiberschrieben. 

Fiir welche Organisationsf orm man sich entscheidet, hangt ab 
von den Zielen, die man mit der Stichprobe verfolgt, und von 
der Art wie der AdaptionsprozeB auf die Stichprobe zugreift. 

In FIG 4 ist der AdaptionsprozeB 9, wie er von dera Monitor- 
prozeB 11 angestoBen wird, abgebildet. Er versucht zunachst 
die Statistik aus dem Stichprobengenerator zu laden 31. Kann 
dies erfolgen, so ist es moglich, aus Ef f izienzgrtinden die 
Wahl der zu adaptierenden Zwischenschritte auf jene zu be- 
schranken, die am meisten zu einer RUckweisung beigetragen 
haben und somit die schwSchsten Glieder in der Verarbeitungs- 
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kette sind, D.h. eine Verbesserung dieser Module fiihrt zur 
groliten Verbesserung des Lesesystems . Kann keine Statistik 
geladen werden, so werden alle Zwischenschritte adaptiert. 

5 Als nachstes werden die Parameter 5 der zu adaptierenden Mo- 
dule aus dem Lesesystem geladen 32 und fur den Adaptionspro- 
zeli abgelegt. Danach werden die zwischenschrittspezif ischen 
bzw. die parameterspezif ischen Stichproben aus der Stichprobe 
im Stichprobengenerator erstellt 33. Dieser Schritt kann von 

10 einer geeigneten Stichprobenorganisation im Stichprobengene- 
rator 10 profitieren. Im nachsten Schritt werden die Adapti- 
onsalgorithmen 35 aus einer Algorithmensammlung ausge- 
wahlt 34. Neben den eigentlichen Algorithmen sind hier Vor- 
aussetzungen an die Stichprobe, Laufzeit, Speicherbedarf usw. 

15 abgelegt. 

Sind alle Voraussetzungen erfullt, kann die Stichprobe fur 
den Parametersatz neu angepafit werden oder eine Adaptionsrei- 
henfolge unter den Parametern berechnet werden. 

20 

Im nachsten Schritt werden die Adaptionen 24 der einzelnen 
Parameter 5 mit dem gewahlten jeweiligen Algorithmus 3 6 und 
der erzeugten Stichprobe 23 gestartet und das erzielte Adap- 
tionsergebnis wird getestet 25. Hierzu wird eine Teststich- 
25 probe 26 ben5tigt, die entweder immer gleich bleibt und mit 
dem System ausgeliefert wurde oder auch vom Stichprobengene- 
rator 10 erzeugt wurde. Diese Teststichprobe 2 6 wird einmal 
durch einen Leser mit der Konf iguration vor der Adaption und 
einmal mit der Konf iguration nach der Adaption bearbeitet und 
die Leseergebnisse verglichen 25. 1st der adaptierte Leser 
besser, so werden die Parameter in den Leser 40 geschrie- 
ben 28, wo sie bei der nachsten Initialisierung geladen wer- 
den. Danach wird der Adaptionsprozeii 9 beendet und gibt an 
den MonitorprozeB 11 zuriick, ob die Adaption erfolgreich war 
35 Oder nicht. 
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Das dargestellte Verfahren laBt sich auch besonders vorteil- 
haft bei zu lesenden Sendungen von Groiikunden anwenden, die 
stapelweise angeliefert werden. Die zu lesenden Adressen wei- 
sen Starke Gemeinsamkeiten auf, z.B. einheitliches Schrift- 
bild, gleiche Srtliche Anordnungen auf der Sendung. Wird jede 
gelesene Sendung in der Stichprobe beriicksichtigt, so konnen 
sich Anderungen in den Sendungs- und Bildeigenschaf ten sofort 
in Anderungen der Parameter auswirken. 
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Patentanspruche 



1. Verfahren zum Lesen von DoJcumenteintragungen und Adres- 
sen mit den Verf ahrensschritten 

- Aufnehmen eines Abbildes der die zu lesenden Inf ormationen 
enthaltenden Oberflache der Dokumente oder Sendungen, 

- automatisches Lesen der Inf ormationen in einem Leser mit 
den Zwischenschritten 

• Layout-Analyse mit 

Bestimmen der die zu lesenden Inf ormationen enthal- 
tenden Gebiete (ROI) , 

Segmentieren in die zu klassif izierenden Bereiche, 
z.B. Zeilen^ Worter und Einzelzeichen, 

• Klassif izieren der segmentierten Bereiche, 

• Interpretation der Ergebnisse aus vorangegangenen 
Schritten, 

wobei Zwischenergebnisse abgreifbar fur die nachf olgenden 
Zwischenschritte solange gespeichert werden, bis ein neues 
Bild gelesen wird, 

- Videocodieren des betreffenden Abbildes bei nicht in vor- 
gegebener Zeitspanne automatisch ermitteltem, eindeutigem 
LeseergebniS/ 

wobei die automatischen Leseschritte in einer vorgelagerten ' 
Adapt ionsphase anhand einer Stichprobe, bestehend aus den 
Bildern mit den zu lesenden Inf ormationen und den dazugehori- 
gen Soll-Leseergebnissen mit ihren Zwischenergebnissen, opti- 
niiert werden, 

dadurch gekennzeichnet, dali wahrend des 
Lesebetriebes bei eindeutig automatisch gelesenen Informatio- 
nen von ausgewahlten Bildern die den Bilddaten des jeweiligen 
Bildes zugeordneten Lese- und Zwischenergebnisse far eine ak- 
tuelle Stichprobe gespeichert werden und/oder bei mit Hilfe 
der Videocodierung eindeutig ermittelten Inf ormationen der 
ausgewahlten Bilder die Bilddaten unter Einbeziehung der zu- 
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gehSrigen, durch Videocodierung ermittelten Inf ormationen in 
einem zweiten automatischen Leseprozeli gleicher Funktionali- 
tat noch einmal gelesen werden und im Falle eines eindeutigen 
Leseergebnisses die Lese- und Zwischenerg.ebnisse den zugeho- 
rigen Bilddaten zugeordnet ebenfalls fiir die aktuelle Stich- 
probe gespeichert werden, und dali mit der aktuellen Stichpro- 
be der automatische Leser neu adapt iert wird. 

2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dali der LeseprozelS beim zweiten automati- 
schen Lesen ohne Zeitbeschrankungen durchgefuhrt wird. 

3. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daii infolge von Inkonsistenzen ungeeignete 
Lese- und Zwischenergebnisse ermittelt und nicht in die 
Stichprobe aufgenommen werden. 

4. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daib far jedes erfolgreich mithilfe des Vi- 
deocodierens gelesene Bild die Zwischenergebnisse beim ersten 
automatischen Lesen mit den dazugehorigen Zwischenergebnissen 
beim zweiten automatischen Lesen verglichen werden und signi- 
fikante Abweichungen als Auswertef ehler in den jeweiligen 
Zwischenschritten beim ersten automatischen Lesen zu einer 
Statistik, z.B. uber die Fehlerhauf igkeit aufsuramiert werden. 

5. Verfahren nach Anspruch 4, dadurch gekenn- 
zeichnet, daI3 nur die Zwischenschritte neu adaptiert 
werden, deren ermittelte Fehlerhauf igkeit wahrend einer be- 
stimmten Zeitspanne iiber einem festgelegten Wert liegt. 



a - 



6. Verfahren nach einem der Anspriiche 1 bis 5, d 
durch gekennzeichnet, dafidie Leserate 
beim ersten automatischen Lesen uberwacht wird, und wenn die 
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Leserate uber einen festgelegten Zeitraum unter einem be- 
stimmten Schwellwert liegt, der Leser Oder die Zwischen- 
schritte mit der aktuellen Stichprobe neu adaptiert werden. 

7, Verfahren nach einem der Anspriiche 1 bis 6^ d a - 
durch gekennzeichnet, dali die Leserate an 
einem automatischen Leser gleicher Funktionalitat uber eine 
Stichprobe mit den vorherigen und neu adaptierten Parametern 
ermittelt wird und bei einer Verbesserung der Leserate durch 
die neu adaptierten Parameter der automatische Leser neu 
initialisiert wird. 



8. Verfahren nach Anspruch 1/dadurch gekenn 
zeichnet, dali die in die Stichprobe aufzunehmenden 

15 Bilder so ausgewahlt werden, dafi die Stichprobe in einer 

festgelegten Zeitspanne eine bestimmte Anzahl neu gelesener 
Bilder mit eindeutig gelesenen Inf ormationen enthalt. 

9. Verfahren nach Anspruch 1, dadurch gekenn 
20 zeichnet, dafi die in die Stichprobe aufzunehmenden 

Bilder so ausgewahlt werden, dali die Stichprobe ein festge- 
legtes Verhaltnis von automatisch gelesenen und videocodier- 
ten Bildern enthalt* 

25 10. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dafi die Stichprobendaten der ausgewahlten, 
aktuell gelesenen Bilder in die urspriingliche Stichprobe ein 
gefugt werden und bei Oberschireiten einer maximalen Anzahl 
von Stichprobenelementen die jeweils altesten Elemente ent- 

30 fernt werden. 

11. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, dafi die urspriingliche Stichprobe durch eine 
aktuelle Stichprobe' ersetzt wird. 

35 
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